下载 InfoQ App >
随时随地获取最新技术资讯
演讲人:嘉宾:伏学发(人瑞人才技术副总裁);主持人:付秋伟(InfoQ极客传媒 资深策划编辑)
演讲人:刘江,徐文浩,赵越,邹盼湘,邵思雨
演讲人:冯柯
策划:李冬梅
策划:Tina
月之暗面推理系统负责人何蔚然从实际业务出发,讲述了在固定集群资源的条件下,通过采用单点和分布式推理架构,提升集群处理大规模请求的能力的挑战和解决思路,希望能给大家带来一些帮助。
违反开源许可的事情,在技术圈内屡见不鲜,但这种行为一旦被揭露,往往会引发轩然大波。
在产品的商业化探索方面,银河通用进展迅速。已经和美团、奔驰、极氪等行业内头部企业开展合作。
超过 95% 的营业额与销售额完全归开发者所有,不需支付苹果任何佣金。
“ LLM 作为服务被引入产品的前景不大,除非 LLM 本身就是产品。”
“在 Blackwell 开始量产时,毛利率将在 70% 出头”
提示词工程(Prompt Engineering)是与大语言模型(LLM)交互的主要方式,旨在挖掘模型潜能并完成复杂任务。那么,究竟什么是提示词工程?它的发展历程、设计原则和未来趋势又是怎样的?
为了加速大模型推理技术的发展,特别是以 KVCache 为中心的缓存池化层的标准化,阿里云与清华大学深度共建 Mooncake 项目,结合主流大模型推理框架,抽象池化 KVCache 的底层接口,实现高效分布式 KVCache。
Ktor 3.0 发布,采用 kotlinx-io 提升性能,支持服务器发送事件、CSRF 保护和从 ZIP 提供静态资源。Ktor 客户端支持 Wasm,但 Kotlin/Wasm 仍处于 Alpha 阶段。
微软悄悄组建了个最大的 AI Agent 生态系统。
技术正成为全球经济增长的新引擎。应用市场将经历过速启动期;以上。年突破千亿人民币市场规模。同时,随着“一带一路”倡议的深入推进,中国企业出海的步伐也在加快,特别是在数字经济领域,中国企业在全球市场的竞争力日益增强。
生成式 AI 带来全新挑战,眼见不一定为真。
2024 年,随着华为的原生鸿蒙操作系统正式发布,雅迪积极响应并再次站在了智能出行的前沿,融合鸿蒙原生智能、原生易用创新特性,开发并上架了鸿蒙原生版雅迪智行 App。
近几年来,GPU 市场发生了巨大的变化。
英伟达下一代 Blackwell 芯片在高密度服务器机架中出现严重过热问题,导致设计变更和客户方面的部署延迟。
呈现 AI 产品交互的创新实践,并探讨 AI 声学硬件与 AI 应用交互的未来趋势与潜力。
谷歌正在 Android 上重建 ChromeOS
火山引擎通过 BMF 框架和自研技术,解决 AI 视频生成中的成本、质量和性能问题,推动行业合作与开源共享。
本文提到了谷歌云 Memorystore 为 Valkey 和 Redis 集群新增向量搜索功能,支持数十亿向量超低延迟搜索,增强 AI 应用,可扩展至 250 个分片,支持混合查询。
在当前的数字化转型浪潮中,AI 已经成为推动企业创新、提升竞争力的关键力量
“AI 的推理能力必须从被动推理变为主动推理。”
阿里集团、Snowflake、腾讯音乐、小红书、Shopee 等 30+ 行业标杆企业联袂呈现,共话 AI 时代下的湖仓技术创新与未来
该研究显示了记忆和真实推理的证据。
11 月 15 日至 16 日,主题为“云端进化•智见未来”的华为云 CIO 领航班第二期在深圳和东莞举办,吸引了来自制造、零售、高科技等企业高管出席。围绕“产业数字化跃迁之路”、“AI 重塑千行万业”等议题以及华为的变革管理、华为研发工具链的实践经验,华为云与嘉宾深度交流并共同探讨了 AI 技术如何助力企业实现数字化升级,加速数字化转型的步伐。
该版本包含了自 PyTorch 2.4 以来的 4095 次提交。
随着人工智能时代的到来,儿歌点点正积极致力于探索 AI 技术与儿童启蒙的融合之道,旨在为孩子们提供更加个性化且丰富的内容资源以及更加多元有趣的互动体验。
微软 AI 和清华大学的研究人员提出了一种名为差分 Transformer(DIFF Transformer)的新架构,旨在提高大语言模型的性能。
生成式 AI 项目越来越多,数据管理的难度也跟着升级!怎样在合规和隐私保护的同时,保持高效?如何优化数据质量,让模型表现更靠谱?
Podman Desktop 1.13 发布,支持 Hyper-V 管理 Podman 机器,集成镜像搜索功能,更新空白状态页,优化 Kubernetes 导航,新增镜像层浏览器扩展,修复错误并提升用户体验。